max rank | avg. rank | sentence |
---|---|---|
184 | 63.1250 | Además de una canción con el mismo nombre. |
262 | 76.8000 | También es el título del primer juego de la serie. |
272 | 157.3750 | 2007 La temporada 2007 comenzó bien para él. |
282 | 105.7500 | Este fue su último trabajo en el programa. |
334 | 111.4000 | En el año 2011 tenía una población de 20 habitantes. |
369 | 106.0000 | Así mismo, es la primera canción del álbum. |
390 | 98.6250 | Se encuentra en el centro de la localidad. |
403 | 142.1250 | En 2009 tenía una población de 8 habitantes. |
418 | 149.5000 | Con ella tuvo un importante número de hijos. |
422 | 142.3333 | Tiene lugar cada dos años en junio desde 2006. |
442 | 176.2727 | Según él, "Es algo que no se debe ver en público". |
451 | 186.2500 | Se trata del edificio más alto de España. |
454 | 133.6250 | Es muy importante la actividad de la construcción. |
463 | 156.4615 | Con lo cual estuvo un total de 18 años al frente del municipio. |
465 | 115.7000 | El orden y nombre de las canciones son también diferentes. |
477 | 152.6667 | Este título fue el último oficial de su carrera. |
478 | 202.2500 | La especie era de tamaño medio a pequeño. |
479 | 184.2500 | Actualmente hay una serie de televisión en producción. |
479 | 216.0000 | Actualmente la empresa cuenta con tres estudios. |
490 | 160.7857 | Esto es debido a que la superficie del agua casi siempre está en movimiento. |
500 | 192.6250 | España comenzó la producción a principios de 2009. |
505 | 223.0000 | Este personaje nunca aparece en la serie. |
527 | 200.1250 | Estos son los temas principales de la película. |
533 | 147.3333 | Fue también director de televisión durante los últimos años de su vida. |
536 | 185.0000 | Con la primera mujer tuvo 12 hijos y con la segunda una hija. |
538 | 181.5000 | Entre los países en los que estuvo se encuentra Argentina. |
541 | 123.4545 | Más tarde, le cuenta a su familia lo que había hecho. |
558 | 127.3000 | En el año 2010 tenía una población de 13 habitantes. |
559 | 228.6667 | Actualmente el pueblo se encuentra allí. |
560 | 161.2000 | Por la misma época, también comenzó su carrera como modelo. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II